智能论文笔记

The Consistency of Adversarial Training for Binary Classification

Natalie S. Frank , Jonathan Niles-Weed

分类：机器学习

2022-06-18

对对抗性扰动的鲁棒性在现代机器学习中至关重要。培训强大分类器的最先进方法之一是对抗性培训，涉及最大程度地减少基于最高的替代风险。在标准机器学习的背景下，可以很好地理解替代风险的统计一致性，但在对抗环境中却没有。在本文中，我们表征了哪些基于最高的替代物对于二进制分类中的Lebesgue度量绝对连续的分布保持一致。此外，我们获得了与对抗分类风险有关的对抗替代风险的定量界限。最后，我们讨论对$ \ ch $ - 对抗训练的持续性的影响。

translated by 谷歌翻译

Existence and Minimax Theorems for Adversarial Surrogate Risks in Binary Classification

Natalie S. Frank

分类：机器学习

2022-06-18

对抗性训练是对对抗性攻击的训练方法最流行的方法之一，但是，从理论角度来看，这并不是很好地理解。我们证明了对抗性替代风险的生存，规律性和最小值定理。我们的结果解释了对先前工作的对抗鲁棒性的一些经验观察，并提出了算法开发中的新方向。此外，我们的结果扩展了以前已知的存在和对替代风险的对抗性分类风险的最小化定理。

translated by 谷歌翻译

On the Existence of the Adversarial Bayes Classifier (Extended Version)

Pranjal Awasthi , Natalie S. Frank , Mehryar Mohri

分类：机器学习 | (统计)机器学习

2021-12-03

对抗性鲁棒性是各种现代机器学习应用中的关键财产。虽然它是最近几个理论研究的主题，但与对抗性稳健性有关的许多重要问题仍然是开放的。在这项工作中，我们研究了有关对抗对抗鲁棒性的贝叶斯最优性的根本问题。我们提供了一般的充分条件，可以保证贝叶斯最佳分类器的存在，以满足对抗性鲁棒性。我们的结果可以提供一种有用的工具，用于随后研究对抗性鲁棒性及其一致性的替代损失。这份稿件是“关于普通贝叶斯分类器的存在”在神经潮端中发表的延伸版本。原始纸张的结果不适用于一些非严格凸的规范。在这里，我们将结果扩展到所有可能的规范。

translated by 谷歌翻译

Archangel: A Hybrid UAV-based Human Detection Benchmark with Position and Pose Metadata

Yi-Ting Shen , Yaesop Lee , Heesung Kwon , Damon M. Conover , Shuvra S. Bhattacharyya , Nikolas Vale , Joshua D. Gray , G. Jeremy Leong , Kenneth Evensen , Frank Skirlo

分类：计算机视觉

2022-08-31

学习在无人驾驶汽车（UAV）捕获的图像中检测物体（例如人类）通常会遭受无人机对物体的位置造成的巨大变化。此外，现有的基于无人机的基准数据集不提供足够的数据集元数据，这对于精确的模型诊断至关重要，并且学习功能不变。在本文中，我们介绍了大天使，这是第一个基于无人机的对象检测数据集，该数据集由具有相似想象条件以及无人机位置以及对象姿势元数据捕获的真实和合成子集组成。一系列实验经过精心设计，使用最先进的对象检测器设计，以证明在模型评估过程中利用元数据的好处。此外，还提供了几种涉及模型微调过程中涉及真实和合成数据的关键见解。最后，我们讨论了有关大天使的优势，局限性和未来方向，以突出其对更广泛的机器学习社区的独特价值。

translated by 谷歌翻译

Zero-Shot AutoML with Pretrained Models

Ekrem Öztürk , Fabio Ferreira , Hadi S. Jomaa , Lars Schmidt-Thieme , Josif Grabocka , Frank Hutter

分类：机器学习 | 人工智能 | 计算机视觉

2022-06-16

鉴于新的数据集D和低计算预算，我们应该如何选择预培训的模型来微调D，并设置微调的超参数而不冒险过度拟合，尤其是在D小的情况下？在这里，我们扩展了自动化的机器学习（AUTOML），以最好地做出这些选择。我们与域无关的元学习方法学习了一个零拍的替代模型，在测试时，该模型允许选择正确的深度学习（DL）管道（包括预训练的模型和微调的超参数）仅给定描述d的琐碎元功能，例如图像分辨率或类的数量。为了训练这种零射模型，我们在大量数据集中收集了许多DL管道的性能数据，并在此数据上收集了元训练，以最大程度地减少成对排名目标。我们在Chalearn AutoDL挑战基准的视觉轨道的严格时间限制下评估我们的方法，显然优于所有挑战竞争者。

translated by 谷歌翻译

Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models

Aarohi Srivastava , Abhinav Rastogi , Abhishek Rao , Abu Awal Md Shoeb , Abubakar Abid , Adam Fisch , Adam R. Brown , Adam Santoro , Aditya Gupta , Adrià Garriga-Alonso

分类：自然语言处理 | 人工智能 | 机器学习 | (统计)机器学习

2022-06-09

语言模型既展示了定量的改进，又展示了新的定性功能，随着规模的增加。尽管它们具有潜在的变革性影响，但这些新能力的特征却很差。为了为未来的研究提供信息，为破坏性的新模型能力做准备，并改善社会有害的效果，至关重要的是，我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战，我们介绍了超越模仿游戏基准（Big Bench）。 Big Bench目前由204个任务组成，由132家机构的442位作者贡献。任务主题是多样的，从语言学，儿童发展，数学，常识性推理，生物学，物理学，社会偏见，软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号，Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为，跨越了数百万到数十亿个参数。此外，一个人类专家评估者团队执行了所有任务，以提供强大的基准。研究结果包括：模型性能和校准都随规模改善，但绝对的术语（以及与评估者的性能相比）；在模型类中的性能非常相似，尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分，而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标；社交偏见通常会随着含糊不清的环境而随着规模而增加，但这可以通过提示来改善。

translated by 谷歌翻译

Winning solutions and post-challenge analyses of the ChaLearn AutoDL challenge 2019

Zhengying Liu , Adrien Pavao , Zhen Xu , Sergio Escalera , Fabio Ferreira , Isabelle Guyon , Sirui Hong , Frank Hutter , Rongrong Ji , Julio C. S. Jacques Junior

分类：机器学习 | 人工智能

2022-01-11

本文报告了Chalearn的Autodl挑战系列的结果和后攻击分析，这有助于对自动学习（DL）进行分类，以便在各种环境中引入的深度学习（DL），但缺乏公平的比较。格式化所有输入数据模型（时间序列，图像，视频，文本，表格）作为张量，所有任务都是多标签分类问题。代码提交已在隐藏的任务上执行，具有限制时间和计算资源，推动快速获取结果的解决方案。在此设置中，DL方法占主导地位，但流行的神经结构搜索（NAS）是不切实际的。解决方案依赖于微调预培训的网络，架构匹配数据模块。挑战后测试没有透露超出强加时间限制的改进。虽然没有组件尤其原始或新颖，但是一个高级模块化组织出现了“Meta-Learner”，“数据摄入”，“模型选择器”，“模型/学习者”和“评估员”。这种模块化使得消融研究，揭示了（离坡）元学习，合奏和高效数据管理的重要性。异构模块组合的实验进一步证实了获胜解决方案的（本地）最优性。我们的挑战队遗产包括一个持久的基准（http://utodl.chalearn.org），获胜者的开放源代码，以及免费的“autodl自助服务”。

translated by 谷歌翻译

Beyond Low Earth Orbit: Biomonitoring, Artificial Intelligence, and Precision Space Health

Ryan T. Scott , Erik L. Antonsen , Lauren M. Sanders , Jaden J. A. Hastings , Seung-min Park , Graham Mackintosh , Robert J. Reynolds , Adrienne L. Hoarfrost , Aenor Sawyer , Casey S. Greene

分类：机器学习

2021-12-22

超越地球轨道的人类空间勘探将涉及大量距离和持续时间的任务。为了有效减轻无数空间健康危害，数据和空间健康系统的范式转移是实现地球独立性的，而不是Earth-Reliance所必需的。有希望在生物学和健康的人工智能和机器学习领域的发展可以解决这些需求。我们提出了一个适当的自主和智能精密空间健康系统，可以监控，汇总和评估生物医学状态;分析和预测个性化不良健康结果;适应并响应新累积的数据;并提供对其船员医务人员的个人深度空间机组人员和迭代决策支持的预防性，可操作和及时的见解。在这里，我们介绍了美国国家航空航天局组织的研讨会的建议摘要，以便在太空生物学和健康中未来的人工智能应用。在未来十年，生物监测技术，生物标志科学，航天器硬件，智能软件和简化的数据管理必须成熟，并编织成精确的空间健康系统，以使人类在深空中茁壮成长。

translated by 谷歌翻译

Beyond Low Earth Orbit: Biological Research, Artificial Intelligence, and Self-Driving Labs

Lauren M. Sanders , Jason H. Yang , Ryan T. Scott , Amina Ann Qutub , Hector Garcia Martin , Daniel C. Berrios , Jaden J. A. Hastings , Jon Rask , Graham Mackintosh , Adrienne L. Hoarfrost

分类：机器学习

2021-12-22

空间生物学研究旨在了解太空飞行对生物的根本影响，制定支持深度空间探索的基础知识，最终生物工程航天器和栖息地稳定植物，农作物，微生物，动物和人类的生态系统，为持续的多行星寿命稳定。要提高这些目标，该领域利用了来自星空和地下模拟研究的实验，平台，数据和模型生物。由于研究扩展到低地球轨道之外，实验和平台必须是最大自主，光，敏捷和智能化，以加快知识发现。在这里，我们介绍了由美国国家航空航天局的人工智能，机器学习和建模应用程序组织的研讨会的建议摘要，这些应用程序为这些空间生物学挑战提供了关键解决方案。在未来十年中，将人工智能融入太空生物学领域将深化天空效应的生物学理解，促进预测性建模和分析，支持最大自主和可重复的实验，并有效地管理星载数据和元数据，所有目标使生活能够在深空中茁壮成长。

translated by 谷歌翻译

Computing the Performance of A New Adaptive Sampling Algorithm Based on The Gittins Index in Experiments with Exponential Rewards

James K. He , Sofía S. Villar , Lida Mavrogonatou

分类：机器学习

2023-01-03

Designing experiments often requires balancing between learning about the true treatment effects and earning from allocating more samples to the superior treatment. While optimal algorithms for the Multi-Armed Bandit Problem (MABP) provide allocation policies that optimally balance learning and earning, they tend to be computationally expensive. The Gittins Index (GI) is a solution to the MABP that can simultaneously attain optimality and computationally efficiency goals, and it has been recently used in experiments with Bernoulli and Gaussian rewards. For the first time, we present a modification of the GI rule that can be used in experiments with exponentially-distributed rewards. We report its performance in simulated 2- armed and 3-armed experiments. Compared to traditional non-adaptive designs, our novel GI modified design shows operating characteristics comparable in learning (e.g. statistical power) but substantially better in earning (e.g. direct benefits). This illustrates the potential that designs using a GI approach to allocate participants have to improve participant benefits, increase efficiencies, and reduce experimental costs in adaptive multi-armed experiments with exponential rewards.

translated by 谷歌翻译